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(57) Abstract: The invention relates to a method for high speed screening for the identification of inhibitors of the activity of editing 
^4 enzymes such as Apobec-1 or the like, and means for implementing said method. The invention especially relates to an appropri- 
ate recombinant construction for screening molecules inhibiting the activity of editing enzymes, comprising an open reading phase 
f-^ containing, in translational fusion, a sequence coding for a signal peptide, a sequence coding for a reporter polypeptide, a sequence 
that can be edited by an editing enzyme, and a sequence coding for a transmembrane domain. When the protein is translated from 
2® a non-edited RNA messenger, the resulting chimeric protein is anchored to the plasmic membrane of the cell. When it is translated 
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from an edited RNA messenger, it is secreted. 



|^ (57) Abrege : La presente invention porte sur un procede de criblage a haut debit pour ridentification d'inhibiteurs de l'activite 
d'enzymes d'edition telles que Apobec-1 ou ses analogues et les moyens pour sa mise en oeuvre. Elle porte en particulier sur une 
construction recombinante appropriee pour le criblage de molecules inhibitrices de l'activite d'enzymes d'edition, comprenant une 
phase ouverte de lecture contenant en fusion traductionnelle : une sequence codant un peptide signal, une sequence codant un 
polypeptide rapporteur, une sequence susceptible d'etre editee par une enzyme d'edition et une sequence codant un domaine trans- 
membranaire. Lorsqu'elle est traduite d'un ARN messager non edite, la proteine chimerique qui en resulte est ancree a la membrane 
plasmique de la cellule. Lorsqu'elle est traduite d'un ARN messager edite, elle est secretee. 
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PROCEDE DE CRIBLAGE A HAUT DEBIT POUR 
[.'IDENTIFICATION DE MOLECULES INHIBITRICES 
DE L'ACTIVITE D'ENZYMES D'EDITION 

La presente invention porte sur un procede de criblage a haut debit pour 
5 ['identification d'inhibiteurs de I'activite d'enzymes d'edition telles que 
Apobec-1 ou ses analogues et les moyens pour sa mise en oeuvre. Elle 
porte en particulier sur une construction recombinante appropriee pour le 
criblage de molecules inhibitrices de I'activite d'enzymes d'edition, 
comprenant une phase ouverte de lecture contenant en fusion 

10 traductionnelle : une sequence codant un peptide signal, une sequence 
codant un polypeptide rapporteur, une sequence susceptible d'etre editee 
par une enzyme d'edition et une sequence codant un domaine 
transmembranaire. Lorsqu'elle est traduite d'un ARN messager non edite, 
la proteine chimerique qui en resulte est ancree a la membrane plasmique 

is de la cellule. Lorsqu'elle est traduite d'un ARN messager edite, elle est 
secretee. 

Les cas d'obesite sont en perpetuelle croissance dans tous les pays et 
contribuent a I'explosion des depenses de sante. En Europe, plus de 1 5% 
de la population est obese et aux Etats-Unis la proportion s'eleve a pres de 

20 30% de la population (50% si Ton inclut les personnes en surcharge 
ponderale). L'international Obesity Task Force en collaboration avec 
('Organisation Mondiale de la Sante (OMS) estime qu'il y a plus de 250 
millions de personnes obeses dans le monde et prevoit que ce chiffre 
augmente dramatiquement dans les annees a venir aussi bien dans les 

25 pays developpes que dans les pays en voie de developpement. Du point de 
vue economique, les couts directs et indirects lies a I'obesite represented 
environ 10% du budget mondial pour la sante. Aux Etats-Unis, par 
exemple, les depenses totales liees a I'obesite correspondent a plus de 100 
milliards de dollars; les depenses directes (52 milliards de dollars) 

30 represented 6% des depenses de sante du gouvernement americain. A 
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I'heure actuelle, il n'existe aucun traitement qui soit vraiment efficace et 
sans effets secondaires incommodants. 

L'obesite est consideree comme une pathologie qui se caracterise par la 
persistance d'un desequilibre energetique positif, les apports energetiques 
etant superieurs aux depenses energetiques. II en resulte alors une 
surcharge ponderale qui peut etre chronique selon la severite de l'obesite. 
Bien que les causes reelles de la maladie restent encore inconnues, 
certaines donnees medicales et scientifiques suggerent que l'obesite est 
plurifactorielle. Elle resulterait de I'age, de facteurs environnementaux et/ou 
socioculturels et d'un disfonctionnement des mediateurs controlant la 
regulation du metabolisme. De plus, une predisposition genetique peut 
egalement favoriser la survenue de la maladie. 

Certains ARN messagers specifiques sont modifies selon un mecanisme 
enzymatique cellulaire connu sous le nom d'edition (pour revue, voir Gott et 
Emeson, Annu. Rev. Genet, 2000, 34: 499-531). En particulier, I'edition 
peut consister en la substitution d'un nucleotide particulier d'un ARN 
messager par un autre nucleotide, en particulier une cytidine par une 
uridine, ou en I'insertion ou la suppression d'un ou plusieurs nucleotides. 
Lorsque la cytidine est situee dans un codon CAA, la substitution par un 
uridine conduit a la formation d'un codon stop. Le gene apoB est un 
exemple de gene dont I'ARN messager est modifie par un tel processus 
d'edition. 

Le gene apoB code pour deux proteines, apoB100 et apoB48. Ces deux 
proteines sont traduites a partir du meme ARN messager. L'ARN messager 
de apoB est en effet susceptible d'etre modifie par une enzyme d'edition 
nommee Apobec-1 par remplacement de la cytidine correspondant au 
nucleotide 6666 de la sequence humaine de I'ARNm apoB, par un uridine, 
creant un codon stop. 
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Dans le systeme digestif de rhomme, I'enzyme d'edition Apobec-1 est 
exprimee dans I'intestin mais pas dans le foie. Dans I'intestin, TARN 
messager est edite, ce qui aboutit a la production du polypeptide apoB48. 
ApoB48 est essentielle pour la formation des chylomicrons, qui servent a 
5 I'absorption et au transport du cholesterol, des triglycerides et autres lipides 

en provenance de I'intestin. Dans le foie, ou I'enzyme Apobec-1 n'est pas 
exprimee, et ou aucune edition de TARN messager d'apoB n'a lieu, la 
proteine produite est apoB100, une lipoproteine de tres faible densite 
(VLDL, Very Low Density Lipoproteins) et de faible densite (LDL, Low 
10 Density Lipoproteins). 

L'analyse de patients atteints de maladies monogeniques associees a un 
phenotype maigre du a un defaut d'absorption des lipides a conduit a 
proposer une nouvelle approche pour le traitement de I'obesite fondee sur 
I'utilisation de molecules inhibitrices de I'activite d'edition de Apobec-1 pour 
15 le traitement de I'atherosclerose et de I'obesite ou tout autre maladie 

caracterisee notamment par un niveau de chylomicrons et/ou de VLDL 
eleve. Cette approche a ete decrite en detail dans le brevet frangais FR97 
16655, delivre en mai 2002. 

La mise en ceuvre de cette methode de traitement necessite I'identification 
20 de molecules inhibitrices ayant pour cible specifique I'activite de I'enzyme 
responsable de I'edition du gene apoB, Apobec-1. 

Le brevet FR97 04388 decrit une methode de detection de deamination 
d'une cytidine dans un ARN. La methode est fondee sur la methode par 
extension d'amorces comprenant Incorporation de nucleotides marques 

25 par transcription inverse. Selon la structure editee ou non editee de TARN 
matrice, le nombre de nucleotides marques incorpores varie et ce nombre 
peut etre mesure par detection des nucleotides marques. Sur le meme 
principe, il est possible d'arreter I'extehsion par incorporation de 
dideoxyguanine a la place de la guanine, selon la methode decrite 

30 notamment par Davies et a/. (J Biol Chem, 1989, 264(23) : 13395-13398). 
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Ces methodes, toutes basees sur la mise en evidence d'une modification 
des sequences de I'ARN messager ne sont pas quantitatives et s'averent 
peu adaptees pour detecter une modulation de I'activite de I'enzyme 
Apobec-1. En outre, elles sont couteuses en materiel et en main d'ceiivre, 
et requierent en general I'utilisation d'une source de radioactivite. 

II existe done un reel besoin de mettre au point un procede de criblage a 
haut debit qui permette de mesurer I'activite d'edition de I'enzyme Apobec- 
1 afin d'identifier des molecules inhibitrices, potentiellement d'interet pour le 
traitement de I'atherosclerose, de I'obesite et/ou du diabete. Un tel procede 
doit etre facile a mettre en oeuvre et doit permettre une mesure precise, 
rapide et specifique de I'activite de I'enzyme Apobec-1 . 

La solution proposee par la presente invention consiste a exprimer un gene 
comprenant une sequence codant en fusion traductionnelle un peptide 
signal, un polypeptide rapporteur fusionne a une zone d'edition optimale 
d'une enzyme d'edition, telle que I'enzyme Apobec-1, par exemple la zone 
d'edition d'apoB et un domaine transmembranaire d'ancrage a la 
membrane plasmique (figure 1). Dans le cas ou I'edition enframe la 
formation d'un codon stop ou un decalage de phase, la proteine chimerique 
traduite a partir de I'ARN non edite est ancree a la membrane plasmique, 
via son domaine transmembranaire, au contraire, la proteine chimerique 
synthetisee a partir de I'ARN edite, est depourvue du domaine 
transmembranaire et secretee dans le milieu extracellulaire grace a la 
presence du peptide signal. A I'inverse, dans le cas ou I'edition entrame la 
suppression d'un codon stop et le retablissement d'une phase codante, la 
proteine chimerique traduite a partir de I'ARN edite reste ancree a la 
membrane plasmique, via son domaine transmembranaire, au contraire, la 
proteine chimerique synthetisee a partir de I'ARN non edite, est depourvue 
du domaine transmembranaire et secretee dans le milieu extracellulaire 
grace a la presence du peptide signal. 
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Ainsi, quel que soit le mecanisme d'edition etudie, il suffit done de doser la 
quantite de proteine chimerique secretee dans le milieu au moyen du 
polypeptide rapporteur pour determiner la quantite d'ARN edite. 

Ainsi, invention porte notamment sur une construction recombinante 
appropriee permettant I'expression d'une proteine chimerique dans les 
conditions decrites ci-dessus. 

En particulier, I'invention porte sur un acide nucleique approprie pour le 
criblage de molecules inhibitrices de I'activite d'une enzyme d'edition, 
notamment de I'enzyme Apobec-1 ou d'un analogue de Apobec-1, 
comprenant une phase ouverte de lecture comprenant au moins les 
elements suivants dans le sens 5'-3' : 

a) une sequence codant un peptide signal permettant I'adressage 
extracellulaire d'un polypeptide auquel ledit peptide signal est fusionne, 

b) une sequence codant un polypeptide rapporteur, en phase avec la 
sequence du peptide signal, 

c) un site d'edition comprenant un codon editable en phase avec la 
sequence codante du polypeptide rapporteur defini en b., ledit site d'edition 
etant choisi parmi les sequences susceptibles d'etre editees par une 
enzyme d'edition, soit par substitution d'un nucleotide situe au niveau d'un 
codon par un autre nucleotide pour former un codon stop, soit par insertion 
ou suppression d'un nucleotide dans la phase codante conduisant a un 
decalage de phase, soit par substitution d'un nucleotide situe au niveau 
d'un codon stop par un autre nucleotide pour former un codon codant. 

Ledit acide nucleique ou construction recombinante constitue un moyen 
pour la mise en ceuvre de la methode de criblage d'inhibiteurs d'une 
enzyme d'edition, notamment Apobec-1 ou I'un de ses analogues, telle que 
detaillee ci-apres. 
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Le terme « acide nucleique » signifie au sens de I'invention, sauf precision 
specifique, un polymere de nucleotides comprenant au moins 50 
nucleotides, simple brin ou double brin, ADN ou ARN notamment. En tout 
etat de cause, il s'agit d'une sequence isolee de son environnement 
5 naturel, et notamment du corps humain ou animal. 

Au sens de I'invention, on entend par Apobec-1, I'enzyme responsable de 
I'edition du gene apoB chez I'homme et dont le gene a ete decrit par Fujino 
et al., 1998, Genomics, 47:266-275; Hirano et al., 1997, J Lipid Res, 
38 :847-859. 

Au sens de I'invention, on considerera comme « enzyme d'edition », toute 
enzyme capable d'editer un ARN messager, soit par substitution d'un ' 
nucleotide situe au niveau d'un codon par un autre nucleotide pour former 
un codon stop, soit par insertion ou suppression d'un nucleotide dans la 
phase codante conduisant a un decalage de phase, soit par substitution 
d'un nucleotide situe au niveau d'un codon stop par un autre nucleotide 
pour former un codon codant. 

Differentes enzymes d'edition ont ete decrites dans I'etat de la technique et 
sont notamment decrites par Gott et Emeson (Annu. Rev. Genet. 2000, 34 : 
499-531). 

20 Plus particulierement, on considerera comme « analogue de Apobec-1 », 
toute enzyme d'edition capable de substituer une cytidine au niveau d'un 
codon CAA par un uridine pour former le codon stop UAA. Un analogue de 
Apobec-1 peut comporter des homologies de structure avec I'enzyme 
Apobec-1, il s'agit alors d'homologues fonctionnels de Apobec-1. II peut 

25 aussi comporter une structure radicalement differente. 

Des analogues de Apobec-1 ont ete decrits dans I'etat de la technique, 
notamment dans les demandes de brevets EP 1 174 509 A1, US 5,747,319 
etUS 5,804,185. 
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On entend par « phase ouverte de lecture », une sequence d'acide 
nucleique susceptible d'etre traduite, le cas echeant apres transcription et 
maturation des ARN messagers correspondants, et commengant par un 
codon ATG a I'extremite 5' de la phase ouverte de lecture (AUG dans le 
5 cas d'une sequence d'ARN) et se terminant par un codon stop TAA, TAG 

ou TGA (UAA, UAG ou UGA dans le cas d'une sequence d'ARN) a 
Textremite 3'. 

Le peptide signal 

Un premier element de la construction recombinante selon I'invention 
10 concerne la sequence codant le peptide signal. La sequence codant le 

peptide signal doit etre placee a I'extremite 5' de la construction de sorte 
que le peptide signal se situe a I'extremite N-terminale de la proteine 
chimerique correspondante. Classiquement, la sequence du peptide signal 
est une sequence de 15 a 20 acides amines, riche en acides amines 
is hydrophobes (Phe, Leu, lie, Met et Val). Le peptide signal selon I'invention 

a pour fonction de rediriger I'adressage d'un polypeptide heterologue 
auquel il est fusionne vers les vesicules de secretion, et de permettre la 
secretion dudit polypeptide, des lors que ce. polypeptide est depourvu de 
domaine transmembranaire. 

20 L'homme du metier choisira de preference, le peptide signal en fonction de 

I'hote cellulaire dans lequel I'acide nucleique sera introduit. Dans un mode 
de realisation specifique, le peptide signal est un peptide issu d'un 
polypeptide exprime dans une cellule de mammifere. 

A titre d'exemples de peptide signal utilisable, on citera en particulier le 
25 peptide SS, I'hormone de croissance, I'activateur du plasminogene 

tissulaire, l'interleukine-2, la chaine k des immunoglobulines, I'alkaline 
phosphatase, I'haemaglutinine d'lnfluenza. 
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Le polypeptide rapporteur 

Un autre element de la construction recombinante selon I'invention 
concerne la sequence codant le polypeptide rapporteur. 

On entend par polypeptide « rapporteur », un polypeptide qui peut etre 
aisement detecte et quantifies du fait de sa structure ou de ses proprietes 
particulieres. Dans un mode de realisation particulier, le polypeptide 
rapporteur est code par une sequence qui n'est pas naturellement associee 
a un site d'edition (sequence heterologue). 

Par exemple, un tel polypeptide est une enzyme dont Pactivite peut etre 
aisement detectee, par detection de la quantite de produit resultant de la 
reaction catalytique. Elle peut egalement etre une proteine fluorescente. 
Cela peut egalement etre un antigene reconnu specifiquement par un 
anticorps ou de maniere generate, tout peptide ou polypeptide capable 
d'etre reconnu par un ligand specifique. Le ligand correspondant peut alors 
etre marque par tout marquage approprie, par exemple un marquage 
radioactif ou fluorescent et la liaison ligand-polypeptide rapporteur est 
detectee aisement par des moyens appropries. 

L'homme du metier selectionnera la sequence du polypeptide rapporteur de 
son choix. De preference, la longueur de la sequence codant le polypeptide 
rapporteur est comprise entre 100 et 4000 pb, et mieux entre 500 et 1 000 
pb. 

A titre d'exemples de sequences de polypeptide rapporteur, on citera en 
particulier P EGFP, la luciferase du ver luisant, la luciferase de renilla, la 
luciferase de vargula, la fi-lactamase (TEM-1), la li-Galactosidase, la 
phosphatase alcaline secretee (SEAP), la chloramphenicol 
acetyltransferase (CAT), la ^-glucuronidase. En ce qui concerne la 
luciferase de vargula et la SEAP, ces rapporteurs sont naturellement 
secretes et ne necessitent done pas Pajout d'un peptide signal heterologue. 
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La sequence du polypeptide rapporteur est choisie de preference dans le 
groupe constitue des rapporteurs EGFP, p-lactamase et luciferase. Le 
polypeptide EGFP peut etre quantifie par mesure de la fluorescence emise 
directement par ce polypeptide a I'aide d'un spectrofluorometre comme 
decrit par exemple dans Laukkanen et a/., 1996, Biochem Biophys Res 
Commun. 226 : 755-61 ; Pol et al., 2002, J Biomol Screen 7 : 325-32. 
L'activite p-lactamase peut etre mesuree a I'aide d'un spectrophotometre 
ou un spectrofluorometre comme decrit par exemple dans Bebrone et al., 
2001, Antimicrob Agents Chemother 45:1868-71 et Moore ef al., 1997, 
Anal Biochem 247 : 203-9. L'activite luciferase peut etre mesuree a I'aide 
d'un luminometre utilisant la luciferine et I'ATP comme decrit par exemple 
dans Pouli et al., 1998, Biochem J 331 : 669-675. 

Le site d'edition 

Un element essentiel de I'acide nucleique selon I'invention est le site 
d'edition tel que defini au point c). Par « site d'edition », on entend toute 
sequence contenant les elements necessaires pour I'edition d'un ARN 
messager, soit par substitution d'un nucleotide situe au niveau d'un codon 
par un autre nucleotide pour former un codon stop, soit par insertion ou 
suppression d'un nucleotide dans la phase codante conduisant a un 
decalage de phase, soit par substitution d'un nucleotide situe au niveau 
d'un codon stop par un autre nucleotide pour former un codon codant. 

De preference, le site d'edition comprend les elements necessaires a la 
substitution d'une cytidine d'un codon CAA par un uridine pour former le 
codon stop UAA, lorsque ladite sequence est exprimee sous la forme d'un 
ARN messager dans une cellule exprimant une enzyme d'edition 
appropriee, telle que Apobec-1 ou I'un de ses analogues. Ainsi, un tel site 
d'edition comprend necessairement au moins le codon editable, par 
exemple, CAA, mais egalement des sequences directement adjacentes 
necessaires a I'edition. 
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Des sites d'edition introduisant un codon stop ont ete identifies sur des 
genes d'organismes eucaryotes et notamment le gene apoB, le gene NAT1 
(Genes Dev. 11:321-33, 1997), le gene de la neurofibromatose de type 1 
(Am. J. Hum. Genet. 70:38-50, 2002; Trends Genet. 12: 418-424, 1996) et 
5 la gene vpr de HIV (Science 289 : 1564-6, 2000). 

Des sites d'edition retablissant une phase de lecture ont ete egalement 
identifies et notamment le gene de I'antigene du virus de I'hepatite delta 
(Nature 380: 454-456, 1996). 

En particulier, la region impliquee dans I'edition de I'ARNm apoB a ete 
10 caracterisee par Driscoll et a/., 1993, Mol Cell Biol, 13(12), 7288-7284 et 
Davies et at. 1989, J Biol Chem, 264(23) : 13395-13398. 

De preference, on utilisera la sequence du site d'edition de apoB chez 
I'homme. La sequence du gene apoB chez I'homme est accessible dans la 
base GenBank sous le numero NM_00384 et decrite a la figure 8. Dans le 
15 texte qui suit, les positions des nucleotides du site d'edition de apoB sont 
indiquees par reference a la sequence de apoB decrite a la figure 8. 

Dans un mode de realisation specifique, le site d'edition est une region de 
la phase codante du gene apoB, editable par I'enzyme Apobec-1, de 
preference une region comprenant les nucleotides 6666 a 6681 de la 

20 sequence de apoB, et de maniere encore plus preferee une region 
comprenant les nucleotides 6645 a 6703, ou encore une region ayant au 
moins 60% d'identite avec la region d'edition de la phase codante de apoB 
constitues des nucleotides 6648 a 6681, de preference 70% d'identite avec 
cette derniere, voire 80% d'identite, et conservant la propriete d'etre 

25 editable par I'enzyme Apobec-1 . 

La sequence du site d'edition peut etre choisie parmi les sequences des 
genes apoB de mammifere et en particulier des genes apoB humain, du 
chien, de la souris, du pore, du rat, du chat, du cheval, du mouton ou du 
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lapin. Les sequences du site d' edition de ces genes ont ete decrites plus 
particulierement a la figure 2 de I'article de Chester et a/., 2000, BBA, 1-13, 
dont le contenu est incorpore par reference. 

A titre d'exemple, le site d'edition comprend la region codante de apoB 
5 constitute des nucleotides 6507 a 6860 de la sequence de apoB. 

La region transmembranaire 

Un autre element de I'acide nucleique selon I'invention concerne la 
sequence codant la region transmembranaire, situee en 5' du site d'edition. 
On entend par « region transmembranaire », un domaine polypeptidique 

10 permettant I'ancrage d'un polypeptide auquel il est fusionne a la membrane 
plasmique. De preference, I'origine de la sequence codant le domaine 
transmembranaire choisi dependra de I'hote cellulaire dans lequel I'acide 
nucleique sera introduit. Par exemple, le domaine transmembranaire peut 
etre issu d'une proteine exprimee dans une cellule de mammifere. Le 

15 domaine transmembranaire peut en particulier etre choisi dans le groupe 

constitue : 

- du domaine transmembranaire du recepteur humain de la transferrine, 

- du domaine transmembranaire de la chame B du recepteur au facteur de 
croissance derive des plaquettes humain (PDGFR), 

20 - du domaine transmembranaire B7-1 de souris (B7), ou encore 

- du domaine transmembranaire de type II de la sous-unite H1 du 
recepteur de I'asialoglycoproteine (ASGPR). 

Les differents elements detailles ci-dessus forment la phase ouverte de 
lecture de I'acide nucleique selon I'invention, codant, dans sa forme non 
25 editee, pour une proteine chimerique comprenant, de I'extremite N- 

terminale a la partie C-terminaie, un peptide signal, un polypeptide 
rapporteur et un domaine transmembranaire. Le site d'edition est insere 
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entre la sequence du polypeptide rapporteur et la sequence du domaine 
transmembranaire. Dans un mode de realisation prefere, la phase codante 
de I'acide nucleique est essentiellement constitute des elements definis ci- 
dessus, peptide signal, polypeptide rapporteur, site d'edition et domaine 
transmembranaire. Elle peut comprendre en plus, le cas echeant, une 
sequence appropriee pour la reconnaissance de la proteine chimerique, sa 
quantification et/ou sa purification, et notamment une sequence d'un 
epitope. 

Pour simplifier la lecture, sauf precision specifique, dans le texte qui suit, 
par « phase ouverte de lecture codant la proteine chimerique », on fera 
reference a la phase ouverte de lecture de I'acide nucleique selon 
Tinvention telle que definie ci-dessus. 

L'acide nucleique selon Tinvention peut comprendre en outre les elements 
necessaires a 1'expression de ladite phase ouverte de lecture codant une 
proteine chimerique dans une cellule hote et en particulier les elements de 
controle de la transcription et de la traduction de la phase codante, tels que 
les promoteurs, les sequences activatrices, les sequences terminatrices. 

Un promoteur est une sequence regulatrice de I'ADN situee en amont de la 
phase codante et qui permet de fixer I'ARN polymerase d'une cellule pour 
initier la transcription du gene en ARN messager. Parmi les exemples de 
promoteurs utilisables, on citera en particulier les promoteurs de cellules 
eucaryotes, et de preference de cellules de mammiferes, les promoteurs 
derives de virus (comme par exemple les promoteurs CMV, SV40 et RSV), 
de retrovirus ou de proteines de choc thermique. Naturellement, la encore, 
on choisira le promoteur en fonction de la cellule dans laquelle la 
construction doit etre introduite. II s'agit de preference de promoteurs forts 
constitutifs de cellules de mammifere tels que le promoteur du CMV ou tout 
autre promoteur permettant un niveau d'expression au moins equivalent au 
promoteur du CMV. Le niveau d'expression doit etre suffisant pour detecter 
I'activite du rapporteur. Un rapporteur tres sensible pourra etre associe 
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avec un promoteur faible et inversement un rapporteur peu sensible devra 
etre associe avec un promoteur fort (du type CMV). 

L'invention vise en outre un vecteur comprenant : 

(i) un acide nucleique ou construction recombinante approprie pour le 
criblage de molecules inhibitrices de I'activite d'une enzyme d'edition, 
notamment de Apobec-1 ou de I'un de ses analogues, comme defini ci- 
dessus, et 

(ii) les sequences permettant I'expression de la phase ouverte de lecture 
codant la proteine chimerique, dans une cellule hote appropriee. 

Le vecteur d'expression est choisi en fonction de la cellule hote dans 
laquelle la construction est introduite. De preference, il est choisi parmi les 
vecteurs d'expression de cellules de mammiferes en vue de son 
introduction dans une cellule hote de mammifere. Un vecteur selon 
l'invention peut comprendre en outre les elements suivants : une sequence 
de replication dans une cellule procaryote, par exemple, E. coli, un 
marqueur de selection d'une cellule procaryote et un marqueur de selection 
d'une cellule eucaryote, en particulier d'une cellule de mammifere, tel que 
le marqueur de resistance a la geneticine ou a I'hygromycine. II peut 
comprendre en outre une region comprenant une combinaison de sites 
d'enzymes de restriction permettant le clonage de molecules d'acides 
nucleiques. 

Un exemple de vecteur d'expression comprenant un acide nucleique selon 
l'invention est le vecteur pDisplay contenant I'insert tel que decrit dans la 
partie experimentale ci-apres. 

Une fois le vecteur d'expression construit, I'homme du metier peut utiliser 
toutes techniques appropriees connues de I'etat de la technique pour 
I'amplifier. 
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Le vecteur d'expression ou I'acide nucleique selon I'invention est ensuite 
introduit dans une cellule note appropriee pour permettre I'expression de la 
phase ouverte de lecture codant la proteine chimerique. La cellule note est 
selectionnee de preference parmi les cellules notes eucaryotes, de 
5 preference de mammifere, et de maniere encore preferee de I'homme. Des 

exemples de cellules notes sont en particulier les lignees cellulaires CHO, 
COS, HeLa, C127, 3T3, HepG2 ou L(TK"), la lignee humaine Caco-2 et la 
lignee murine MacArdleRH777 ; de preference il s'agit de la lignee HepG2. . 

L'invention vise en consequence les cellules hotes ainsi obtenues apres 
10 transformation. 

Dans un mode de realisation prefere, la cellule h6te comprend : 

(i) un acide nucleique selon l'invention approprie pour le criblage 
d'inhibiteurs d'une enzyme d'edition, notamment de Apobec-1 ou de 
I'un de ses analogues; et, 

15 (ii) une sequence permettant la synthese d'une enzyme d'edition 

fonctionnelle, notamment une enzyme Apobec-1 ou I'un de ses 
analogues, susceptible d'editer la phase ouverte de lecture codant la 
proteine chimerique. 

De preference, ladite sequence permet une expression forte du gene 
20 codant I'enzyme d'edition, notamment Apobec-1 ou I'un de ses analogues. 
La sequence codant I'enzyme d'edition, notamment Apobec-1 ou I'un de 
ses analogues, peut par exemple etre placee sous controle d'un promoteur 
fort, par exemple le promoteur du CMV ou un promoteur permettant un 
niveau d'expression du gene place en aval au moins identique. 

25 De preference, la sequence permettant la synthese de I'enzyme d'edition 
est introduite de maniere stable dans le genome d'une cellule hote 
eucaryote, de maniere preferee d'une cellule de mammifere, et mieux d'une 
cellule humaine. La transfection stable des cellules est realisee par les 
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techniques classiques connues de I'homme du metier, par exempie 
decrites dans Sambrook et al. (2001, « Molecular Cloning: A laboratory 
manual », 3rd Ed., Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York), en utilisant notamment des marqueurs de selection 
appropries tels que le marqueur de resistance a la geneticine ou le 
marqueur de resistance a I'hygromycine. 

On obtient ainsi une cellule exprimant I'enzyme d'edition et la proteine 
chimerique. Selon I'activite de I'enzyme d'edition, ladite proteine chimerique 
est secretee ou est ancree dans la membrane plasmique via son domaine 
transmembranaire. 

L'invention vise ainsi une methode de criblage d'inhibiteurs de I'activite de 
I'enzyme d'edition, notamment de Apobec-1 ou d'un analogue de Apobec- 
1 , ladite methode comprenant : 

a) la culture d'une cellule telle que definie ci-dessus, dans des conditions 
appropriees pour la synthese de I'enzyme d'edition et d'une proteine 
chimerique comprenant au moins le peptide signal et le polypeptide 
rapporteur, tels que definis plus haut, en presence ou en absence d'un 
compose candidat, 

b) la mesure de la quantite de proteines chimeriques secretees dans le 
milieu de culture, en presence ou en absence du compose candidat, 

c) le cas echeant, la mesure de la quantite de proteines chimeriques 
ancrees a la membrane cellulaire par le domaine transmembranaire, en 
presence ou en absence du compose candidat, 

d) la mise en evidence d'une variation de la quantite relative de proteines 
chimeriques secretees en presence du compose candidat, par rapport 
a la quantite relative de proteines chimeriques secretees en absence 
du compose candidat, indiquant que ledit compose candidat est un 
inhibiteur de I'activite d'edition de I'enzyme d'edition, notamment de 
Apobec-1 ou de I'un de ses analogues. 
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Par « quantite relative », il faut comprendre que la quantite absolue de 
proteines chimeriques secretees par cellule est rapportee a la quantite 
absolue de proteines chimeriques secretees par une cellule « controle » ; 
ladite cellule « controle » etant caracterisee en ce qu'elle comprend un 
acide nucleique identique a I'acide nucleique editable a I'exception du site 
d'edition qui comprend le codon sous sa forme editee, a la place du codon 
editable, par exemple un codon stop TAA dans le cas de ('utilisation de 
Apobec-1 ou I'un de ses analogues. Une cellule exprimant un tel acide 
nucleique controle permet d'evaluer le niveau de synthese equivalent a une 
activite optimale de I'enzyme d'edition, soit 100% d'edition. 

Bien entendu, tout autre type de controle pourra etre utilise des lors qu'il 
permet de confirmer que la diminution ou I'augmentation de la quantite de 
proteines chimeriques secretees est bien correlee a une diminution de 
I'activite d'edition et non a une toxicite et/ou une inhibition d'un processus 
cellulaire implique dans la synthese ou la secretion de la proteine 
chimerique et notamment les processus generaux de transcription et/ou de 
traduction de la cellule. Des exemples d'acides nucleiques controles sont 
decrits en detail dans la partie experimental qui suit. 

Dans un mode de realisation particulier, la proteine chimerique comprend 
une proteine fluorescente comme polypeptide rapporteur et la mesure de la 
quantite de proteines chimeriques secretees dans le milieu est effectuee 
par mesure de la fluorescence dans le milieu de culture apres elimination 
des cellules. Dans un autre mode de realisation, la proteine chimerique 
comprend un polypeptide rapporteur ayant une activite p-lactamase et la 
mesure de la quantite de proteines chimeriques secretees dans le milieu 
est effectuee par spectrocolorimetrie. Dans un autre mode de realisation, la 
proteine chimerique comprend un polypeptide rapporteur ayant une activite 
chemiluminescente et la mesure de la quantite de proteines chimeriques 
secretees dans le milieu est effectuee a I'aide d'un luminometre. 
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L'invention porte en outre sur toute utilisation d'un acide nucleique editable 
ou d'un vecteur d'expression tel que defini ci-dessus pour la mise en ceuvre 
d'une methode de criblage d'inhibiteurs de I'activite d'une enzyme d'edition 
telle que Apobec-1 ou I'un de ses analogues. 

L'invention vise egalement un kit pour la mise en ceuvre d'une telle 
methode, comprenant soit un acide nucleique editable selon l'invention, soit 
un vecteur d'expression selon l'invention, soit une cellule comprenant un 
acide nucleique selon l'invention et le cas echeant, des tampons appropries 
pour la mise en ceuvre de la methode de criblage et/ou des instructions 
pour la mise en ceuvre de la methode de criblage. Le kit peut comprendre 
en outre les acides nucleiques « controles » ou les vecteurs ou les cellules 
comprenant ces acides nucleiques « controles » tels que decrits 
precedemment. 

Dans un mode de realisation particulier, les molecules testees dans le 
cadre de la methode de criblage selon l'invention sont par exemple choisies 
parmi des analogues des inhibiteurs de la cytidine deaminase comme la 
zebularine, la 5-fluorozebularine, la 3,4,5,6-tetrahydrouridine et la 3- 
deazacytidine. De preference, des molecules candidates pour la mise en 
ceuvre du procede de criblage sont des molecules telles qu'identifiees en 
fonction de leur structure tridimensionnelle predite et de la structure 
tridimensionnelle predite de Apobec-1 . 

Les caracteristiques de l'invention mentionnees ci-dessus, ainsi que 
d'autres, apparattront plus clairement a la lumiere des exemples presentes 
ci-apres. 
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DESCRIPTION DES FIGURES 

Fig 1. Un systeme rapporteur pour I'edition de I'apoB. 

Fig 2. pAE.C, le systeme rapporteur «editable». 

Fig 3. pAE.U, le systeme rapporteur «edite». 

Fig 4. pAE.G, le systeme rapporteur «non-editable». 

Fig 5. Constructions des rapporteurs : A. La premiere etape consiste a 
inserer les genes rapporteurs entre les sites Bglll et Sacll du plasmide 
pDisplay. La seconde a inserer le fragment de I'apoB entre ies sites Sacll 
et Sail. B. Le site de clonage est montre ainsi que les etiquettes HA et Myc. 

Fig 6. Caracterisation des clones cellulaires McArdle-Apobec 
exprimant le rapporteur li-lactamase : A. Les proteines extraites des 
milieux de culture et des lysats cellulaires sont separees par la technique 
de SDS-PAGE et detectees au moyen d'un anticorps anti-HA. Les deux 
isoformes du rapporteur fi-lactamase different d'environ 14,5 kDa. Elles 
sont marquees par une fleche pleine pour la forme editee et vide pour la 
forme editee. B. L'organisation des deux isoformes est schematisee. II faut 
noter la presence de I'etiquette HA placee entre le peptide signal et la 
rapporteur. 

Fig 7 : Activite ^-lactamase du milieu extracellulaire des clones 
cellulaires McArdle-Apobec exprimant le rapporteur ft-lactamase. Les 

differents clones cellulaires testes sont ensemences en plaques 96 puits. 
Le lendemain, le milieu extracellulaire est change pour un milieu DMEM 
depourvu de rouge phenol et contenant 1% de serum de veau foetal. Le 
surlendemain, 50 pi de ce milieu extracellulaire sont incubes avec 50 pi de 
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CCF2 (0,4 mM CCF2 dans 50 mM sodium phosphate, pH 7.0) pendant 1 
heure a temperature ambiante. La fluorescence du produit de la reaction 
est detectee a 460 nm sur un lecteur Envision avec une longueur d'onde 
d'excitation a 405 nm. Chacune des barres represents une mesure faite a 
5 partir de puits de cellules independants. 

Fig. 8 : Sequence codante du gene ApoB et du polypeptide 
correspondant. 

PARTI E EXPERIMENTALE 

io Mise en ceuvre d'un test cellulaire 

pour le criblage d'inhibiteurs de I'activite de Apobec-1. 

Pour la construction d'un vecteur d'expression approprie pour la mise en oeuvre 
du procede de criblage selon I'invention, le plasmide pDisplay (Invitrogen, 
Chesnut et a/., 1996, Li, 2000) a ete utilise. Celui-ci comprend : 

15 . un peptide signal pour I'adressage extracellulaire. 

. une etiquette HA (Hemaglutinine de Nnfluenza) 

. un site de clonage 

. une etiquette myc afin de detecter la partie C-terminale, et, 

. une sequence codant pour la partie transmembranaire du recepteur 
20 au PDGF pour I'ancrage a la membrane plasmique. 

Les phases codantes de trois rapporteurs (EGFP, B-lactamase et 
luciferase) ainsi que la zone d'edition d'ApoB (positions 6507-6860 de la 
sequence du gene apoB) ont ete amplifiees. Differentes versions de cette 
derniere ont ete obtenues : 
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> une version comprenant un codon editable CAA constituant la 
version editable, 

> une version identique a la premiere mais comprenant un codon stop 
TAA a la place du codon CAA (controle positif equivalent a 100% 

5 d'edition pour evaluer la specificite de la modulation observee vis-a- 

vis de I'activite d'edition). 

> Une version identique aux versions precedentes mais comprenant 
un codon GAA non editable a la place du codon CAA (contr6le 
negatif equivalent a 0% d'edition). 

10 Les sequences codant les polypeptides rapporteurs ont d'abord ete 
introduites dans le vecteur pDisplay, puis les differentes versions de la 
zone d'edition d'ApoB ont ete ajoutees afin de constituer les 
plasmides suivants: 

pAE.C (pour la cytidine au niveau du site d'edition) 
15 pAE.U (pour la thymidine au niveau du site d'edition) 

pAE.G (pour la guanine au niveau du site d'edition) 

Le plasmide pAE.C a ete transfecte dans des cellules HepG2 surexprimant 
Apobec-1 . II permet la synthese d'un ARN messager editable (figure 2) : 

• S'il n'v a pas d'edition : la sequence n'est pas modifiee, I'ARN est 
20 entierement traduit, et la proteine synthetisee contient le domaine 

transmembranaire du recepteur au PDGF qui permet son ancrage a la 
membrane. La proteine chimerique traduite de I'ARN messager non 
edite n'est pas secretee dans le milieu extracellulaire. 

. S'il v a edition : la cytidine du site d'edition est modifiee par Apobec-1 et 
25 le codon CAA est change en un codon. stop UAA. La proteine traduite de 

I'ARN messager edite est plus courte et depourvue de domaine 
transmembranaire. Elle est par consequent secretee dans le milieu 
extracellulaire. 
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• Les inhibiteurs d'Apobec-1 devraient entramer une diminution du nombre 
de molecules d'ARNs messagers edites, le rapporteur restant ancre a la 
membrane. 

En outre, si I'inhibiteur est specifique d'Apobec-1, il ne devrait pas affecter 
le niveau de proteines produites sous le controle des plasmide pAE.U 
(controle positif, figure 3) et pAE.G (controle negatif, figure 4). 

A. MATERIEL ET METHODES 

Construction des vecteurs d'expression 

La phase codante de differents rapporteurs a ete amplifiee par la 
polymerase d'ADN Pfu (Stratagene) selon les conditions decrites par le 
fabricant grace aux paires d'oligonucleotides suivantes : 

• I'EGFP par 

EGFPBglF (GAGATCTGTGAGCAAGGGCGAGGAGC) et 
EGFPSacR (GCCGCGGCTTGTACAGCTCGTCCATGC) 
a partir du vecteur pEGFP-C2 (Clontech) ; 

• la luciferase de luciole par 

LucBglF (GAGATCTGTCACCGACGCCAAAAACATA) et 
LucSacR (GCCGCGGCACGGCGATCTTTCCGCCC) 
a partir du vecteur pSP-luc+NF (Stratagene) 

• la (^-lactamase par 

LactBglF (GAGATCTCACCCAGAAACGCTGGTGAA) et 
• LactSacR (GCCGCGGCCAATGCTTAATCAGTGAG) 
a partir du vecteur pEF1 V5HisA (InVitrogen). 

Les fragments amplifies ont ete purifies sur gel d'agarose, extraits et 
purifies au moyen du Gel Extraction kit (Qiagen). Puis, ils ont ete 
sousclones dans le vecteur pCR-Blunt (Invitrogen) selon les conditions 
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decrites par le fabricant. L'integrite de la sequence a ete verifiee par 
sequengage. Les fragments codant pour ces rapporteurs ont ete excises 
par les enzymes Bglll et Sacll et ont ete inseres dans ces memes sites 
dans le vecteur pDisplay (InVitrogen) (Fig. 5). Les vecteurs obtenus sont 
respectivement pDisplay-EGFP, pDisplay-Luc et pDisplay-Lac. 

Les ARN ont ete extraits a partir de cellules HepG2 au moyen du RNeasy 
Kit (Qiagen). La phase codante autour de la zone d'edition de I'ApoB 
(6507-6860) a ete amplifiee par RT-PCR au moyen du kit OneStep 
(Qiagen) avec les oligonucleotides ApoBEdF 

(GCCGCGGAATTCATTCAATTGGGAGAGACAA) et ApoBEdR 

(GGTCGACACTACTTCCACTTTTGTTAAAATC). La base cytidine 6666 de 
ce fragment a ete mutee en thymidine et en guanidine par la methode PCR 
en utilisant la polymerase dADN Pfu (Stratagene). Les fragments amplifies 
ont ete sousclones et verifies comme decrit precedemment. Les fragments 
codant l'apoB(6507-6860), l'apoB(6507-6860)[C6666G] et l'apoB(6507- 
6860)[C6666T] ont ete excises par Sacll et Sail et sousclones dans les 
memes sites en aval des genes rapporteurs des vecteurs pDisplay-EGFP, 
pDisplay-Luc et pDisplay-Lac (Fig. 5). On obtient ainsi : 

pAE.C-EGFP pour l'apoB(6507-6860) dans pDisplay-EGFP 

pAE.G-EGFP pour l'apoB(6507-6860)[C6666G] dans pDisplay-EGFP 

pAE.U-EGFP pour l'apoB(6507-6860)[C6666T] dans pDisplay-EGFP 

pAE.C-Luc pour l'apoB(6507-6860) dans pDisplay- Luc 

pAE.G- Luc pour l'apoB(6507-6860)[C6666G] dans pDisplay-Luc 

pAE.U- Luc pour l'apoB(6507-6860)[C6666T] dans pDisplay-Luc 

pAE.C-Lac pour l'apoB(6507-6860) dans pDisplay-Lac 

pAE.G- Lac pour l'apoB(6507-6860)[C6666G] dans pDisplay-Lac 

pAE.U- Lac pour l'apoB(6507-6860)[C6666T] dans pDisplay-Lac 



pAE.n signifie filasmide Apob Editing et la lettre n associee correspond a la 
nature de la base (soit C pour cytidine, soit G pour guanidine, soit U pour 
uridine) en position 6666 du fragment de I'apoB. 
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Les fragments codant pour chacun des rapporteurs ont ete excises par les 
enzymes BamHI et Xhol et sousclones dans les memes sites du plasmide 
pcDNA3.1(+)-Hygro (InVitrogen). On obtient ainsi la serie de plasmides 
pAEH pour glasmide Apob Editing Hygromydne-resistant 

5 Lignees cellulaires 

Les lignees MacArdleRH777 et HepG2 ont ete obtenues de LGC 
Promochem et cultives respectivement dans le milieu de culture DMEM 
(Sigma) et MEM (Cambrex). Elles ont ete transferees au moyen du 
Fugene 6 (Roche) par un vecteur depression codant l'Apobec-1 humaine 

10 et possedant un gene de resistance a la neomycine. Les clones cellulaires 
ayant integres le vecteur ont ete selectionnes par un traitement a 1 g/l de 
G418 (Cambrex). Les clones isoles ont ete cribles pour leur capacite a 
editer la cytidine 6666 du messager de I'apoB (voir methode ci-dessous). 
Les meilleurs clones de chacune de ces lignees, McArdle-Apobec et 

15 HepG2-Apobec, editent respectivement a 100% et a 50% le messager de 

I'apoB. Ces deux lignees constituent la premiere etape de la construction 
de notre systeme rapporteur. Elles ont ensuite ete transferees par les 
plasmides pAEH decrit precedemment au moyen du Fugene 6. Les clones 
cellulaires ayant integres ce second vecteur ont ete selectionnes par un 

20 traitement a 0,25 g/l d'hygromycine (Ozyme) tout en maintenant une 
concentration de 0,5 g/l de G418. Les lignees cellulaires etudiees sont 
ensemencees a une densite de 80 000 cellules/cm2 dans du milieu 
contenant 10% serum de veau foetal (InVitrogen) mais depourvu de rouge 
phenol en presence de G418 et d'hygromycine. Le lendemain, le milieu est 

25 change. C'est a cette etape que les cellules sont traitees par les molecules 

candidates lors du criblage a haut debit. Le surlendemain, le milieu 
extracellulaire est preleve pour analyse. 
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Caracterisation des lignees celluiaires 
RT-PCR/Sequen?age 

Les ARN des cellules etudiees ont ete extraits par RNeasy Kit (Qiagen) et 
I'ADNc d'interet a ete amplifies par OneStep kit (Qiagen) en utilisant une 
paire d'oligonucleotides specifiques. Certains produits de RT-PCR ont ete 
purifies par PCR purification kit (Qiagen), sequences au moyen du kit 
BigDye Terminator v3.1 (Applied Biosystems) et analyses sur ABI3100 
(Applied Biosystems). 

La region autour du site d'edition de I'apoB endogene a ete amplifiee par 
les oligonucleotides rApoBEdF (G C ATCTG ACTG G G AG AG AC AAG ) et 
rApoBEdR (GGATATGATACTGTTCGTCAAGC), pour les cellules . 
MacArdleRH777 et ses derives, et par hApoB6344-F 
(AAGAAAATACAGAGCAGCCCT) et hApoB6820-R 
(GTGCTGGATGTCTATATTCTG) pour les cellules HepG2 et ses derives. 

Le fragment de I'apoB des rapporteurs a ete amplifie par, d'un cote un 
oligonucleotide specifique du debut du fragment codant pour le PDGF-R 
(PDGFRtm-R : AAAGGGCAAGGAGTGTGGC) et de I'autre par un 
oligonucleotide specifique de la fin du fragment codant pour le gene 
rapporteur: EGFP646F (AAGACCCCAACGAGAAGC) pour I'EGFP, 
Lac812F (G G C AACTATG G ATG AACG ) pour la fc-lactamase et Luc1645F 
(CCAAGAAGGGCGGAAAGA) pour la luciferase. 

La nature de la base en position 6666 est caracterisee par sequencage en 
utilisant soit rApoB-seq (AAGTAGCTGGTGCCAAGGA) pour I'ApoB 
endogene de rat soit hApoB6638R (CACGGATATGATAGTGCTCAT) pour 
I'ApoB endogene humaine et les rapporteurs. 
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Expression des genes rapporteurs 

Au jour n°2, les cellules sont rincees dans du milieu depourvu de serum et 
cultivees toute la nuit dans ce milieu. Au jour n°3, le milieu de culture est 
preleve et dilue de moitie dans du tampon Laemmli 2X concentre. Cette 
5 fraction correspond au milieu extracellulaire. Les cellules sont lavees au 
PBS et les cellules sont lysees dans le tampon Laemmli 1X. Les extraits 
sont ensuite analyses par separation par SDS-PAGE. La presence des 
rapporteurs est revelee par immunoblot au moyen d'un anticorps dirige 
contre I'epitope HA qui est situe entre le peptide signal et le gene 
10 rapporteur. 

Activite des rapporteurs 

Fluorescence du rapporteur EGFP 

Au jour n°2, le milieu de culture est change pour du milieu Ham's/F12 
depourvu de rouge phenol. Ce milieu de culture est le milieu commercial 
15 donnant la fluorescence la plus basse. Au jour n°3, la fluorescence du 
milieu extracellulaire est directement mesuree sur un detecteur Analyst HT 
(Molecular Device) (excitation a 485 nm, emission a 510 nm, miroir 
dichroique a 505 nm et polarisation sur le plan p des longueurs d'onde 
d'excitation et d'emission). 

20 Activite li-Lactamase 

Au jour n°2, le milieu de culture est change pour du milieu contenant 1% 
serum de veau foetal. Au jour n°3, I'activite li-lactamase est detectee par 
differents substrats : le CENTA (Calbiochem); la Nitrocefin (Calbiochem) et 
le CCF2 (InVitrogen). Ce dernier etant le plus economique et donnant le 
25 rapport signal/bruit le plus faible, il a ete choisi pour la suite des 
experiences. 50 ul de milieu extracellulaire ont ete melanges avec 50 pi de 
substrat (0,4 uM CCF2 dans 50 mM sodium phosphate, pH 7.0). La 
reaction est suivie par la mesure de la fluorescence sur un detecteur 
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Envision (Perkin Elmer). L'excitation est fixee a 405 nm, I'apparition du 
produit est mesuree a 460 nm alors que la disparities Test a 530 nm. 

B. RESULT ATS 

Les systemes rapporteurs ont ete construits en deux etapes. Dans un 
premier temps, les phases de lecture des trois rapporteurs choisis ont ete 
sousclonees dans le vecteur pDisplay (Fig. 5, etape 1) pour donner les trois 
plasmides pDisplay-EGFP, pDisplay-Luc et pDisplay-Lac. Dans un second 
temps, les fragments 6507-6860 de I'apoB humaine, ou de ses deux 
mutants [C6666G] et [C6666T], ont ete sousclones en aval de ces trois 
systemes rapporteurs (Fig. 5, etape 2) pour donner les vecteur pAE.n (pour 
filasmide Apob Editing, la lettre n (C, G ou U) correspondant a la nature de 
la base cible de I'edition). Enfin, la derniere etape de ces constructions a 
consiste a transferer les phases codantes de ces rapporteurs dans un 
vecteur d'expression portant un gene de selection different de celui utilise 
pour etablir I'expression stable de l'Apobec-1, e'est-a-dire le gene de 
resistance a la neomycine. Nous avons choisi le plasmide pcDNA3.1(+)- 
Hygro comme second systeme d'expression car ce plasmide permet une 
selection a I'hygromycine B. Les neufs plasmides obtenus ont ete nommes 
pAEH.n (pour glasmide Apob Editing Hygromycine-resistant, la lettre n (C, 
G ou U) correspondant a la nature de la base cible de I'edition). 

Ces vecteurs ont ete transfectes dans les cellules McArdle-Apobec et 
HepG2-Apobec et soumis a une pression de selection a I'hygromycine. 
L'expression des systemes rapporteurs a ete caracterisee par RT-PCR en 
utilisant des oligonucleotides specifiques des regions encadrant le fragment 
de I'apoB dans les rapporteurs. Seuls ont ete conserves les clones 
exprimant un taux eleve de rapporteur. La zone d'edition de I'apoB 
endogene a ete amplifiee au moyen d'oligonucleotides specifiques et la 
nature du residu en position 6666 a ete verifiee par sequengage. 
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Les clones positifs sont ensuite testes par immunoblot pour ['expression et 
la secretion du gene rapporteur. La figure 6 montre le resultat obtenu avec 
le systeme li-lactamase dans les McArdle-Apobec. L'anticorps anti-HA peut 
reveler deux proteines ayant une difference correspondant a la fin du 
5 fragment de I'apoB et au domaine transmembranaire du recepteur au 
PDGF, c'est-a-dire environ 14,5 kDa (voir Fig 6B). Trois groupes de clones 
cellulaires ont ete testes : un premier groupe (pistes 1 et 2) correspond au 
rapporteur « non-editable », c'est-a-dire portant la mutation [C6666G] dans 
le fragment d'ApoB, un second groupe (pistes 3 a 6) correspond au 
10 rapporteur « editable », c'est-a-dire portant la sequence endogene de 

I'ApoB et enfin le dernier groupe (piste 7) correspond au rapporteur 
« edite», c'est-a-dire portant la mutation [C6666T] dans le fragment d'ApoB. 

Dans les lysats cellulaires des clones exprimant le rapporteur « non- 
editable », on peut detecter la forme longue du rapporteur (piste 1 et 2, 
panneau du haut). Cette forme longue n'est pas detectee dans le milieu 
extracellulaire (piste 1 et 2, panneau du bas). Dans les lysats cellulaires 
des clones exprimant le rapporteur « editable », la forme courte tronquee 
du rapporteur est principalement detectee, ce qui signifie que I'edition du 
rapporteur par l'Apobec-1 a bien abouti a la synthese d'une forme courte du 
rapporteur (pistes 3 a 6, panneau du haut). Une forme longue du rapporteur 
est egalement detectee pour le clone C.7 (piste 4), ce qui signifie que, dans 
ce cas-ci, I'edition n'est que partielle. Dans tous les cas, la forme courte de 
ce rapporteur est retrouvee dans le milieu extracellulaire (pistes 3 a 6, 
panneau du bas). Enfin, dans les lysats cellulaires des clones exprimant le 
rapporteur « edite », seule la forme courte du rapporteur est observee, que 
ce soit dans le lysat cellulaire ou dans le milieu extracellulaire (piste 7). Les 
memes resultats ont ete observes avec les deux autres systemes 
rapporteurs EGFP et luciferase. Le meme type de resultat est obtenu 
lorsque ces trois types de rapporteurs sont exprimes dans les cellules 
HepG2-Apobec. Cependant, une difference dans le rapport forme courte 
versus forme longue dans le cas du rapporteur editable est observe, ce qui 
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est en concordance avec le fait que le clone HepG2-Apobec parental 
n'edite I'apoB qu'a environ 50%. 

L'activite des rapporteurs a ensuite ete mesuree dans le milieu 
extracellulaire. Nous avons pu y detecter la presence d'EGFP et l'activite fi- 
lactamase mais pas l'activite luciferase. Ce resultat est surprenant car la 
luciferase est extremement sensible. Cependant, il est possible que 
l'activite de certains rapporteurs soit affectee par leur transfert dans la voie 
de secretion. 

L'activite B-lactamase des meilleurs clones cellulaires caracterises dans la 
figure n°6 est montree dans la figure n°7. Les milieux extraceilulaires des 
clones exprimant le rapporteur « editable » (C.7 et C.8), ainsi que celui du 
clone exprimant le rapporteur « edite » (U.5), contiennent une forte activite 
(i-lactamase. En revanche, le milieu extracellulaire du clone exprimant le 
rapporteur « non-editable » (G.17), qui ne secrete pas de rapporteur, ne 
contient pas d'activite fc-lactamase. Les trois barres montrees 
correspondent a des mesures realisees sur trois puits ensemences 
independamment par la meme suspension de cellules. La mesure d'activite 
li-lactamase est tres reproductible d'un puits a I'autre, ce qui en fait un 
systeme particulierement adapte pour le criblage a haut debit. Nous avons 
obtenu le meme type de resultat avec le systeme rapporteur EGFP. 
Cependant, la fluorescence basale elevee des milieux de culture affecte la 
sensibilite de ce systeme. Enfin, nous avons egalement obtenu des 
resultats comparables pour ces trois systemes lorsqu'ils ont ete exprimes 
dans les cellules HepG2-Apobec. 
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REVENDICATiONS 

Acide nucleique approprie pour le criblage de molecules inhibitrices 
de I'activite d'une enzyme d'edition, notamment de I'enzyme 
Apobec-1 ou d'un analogue de Apobec-1, comprenant une phase 
ouverte de lecture comprenant au moins les elements suivants dans 
le sens 5'-3' : 

a. une sequence codant un peptide signal permettant I'adressage 
extracellulaire d'un polypeptide auquel ledit peptide signal est 
fusionne, 

b. une sequence codant un polypeptide rapporteur, en phase avec 
la sequence du peptide signal, 

c. un site d'edition comprenant un codon editable en phase avec la 
sequence codante du polypeptide rapporteur defini en b., ledit 
site d'edition etant choisi parmi les sequences susceptibles d'etre 
editees par une enzyme d'edition, soit par substitution d'un 
nucleotide situe au niveau d'un codon par un autre nucleotide 
pour former un codon stop, soit par insertion ou suppression d'un 
nucleotide dans la phase codante conduisant a un decalage de 
phase, soit par substitution d'un nucleotide situe au niveau d'un 
codon stop par un autre nucleotide pour former un codon codant, 

d. une sequence codant pour une region transmembranaire 
d'ancrage a la membrane plasmique. 

Acide nucleique selon la revendication 1, caracterise en ce que le 
codon editable du site d'edition est le codon CAA susceptible d'etre 
edite en codon stop UAA, par une enzyme Apobec-1 ou I'un de ses 
analogues. 

Acide nucleique selon la revendication 1 ou 2, caracterise en ce que 
le site d'edition est une region de la phase codante du gene apoB, 
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editable par I'enzyme Apobec-1, de preference une region 
comprenant les nucleotides 6666 a 6681 de la sequence de apoB 
definie a la figure 8, et de maniere encore plus preferee une region 
comprenant les nucleotides 6645 a 6703, ou encore une region 
ayant au moins 60% d'identite avec la region d'edition de la phase 
codante de apoB constituee des nucleotides 6648 a 6681, de 
preference 70% d'identite avec cette derniere, voire 80% d'identite, 
et conservant la propriete d'etre editable par I'enzyme Apobec-1 . 

Acide nucleique selon la revendication 3, caracterise en ce que le 
site d'edition comprend la region codante de apoB constituee des 
nucleotides 6507 a 6860 de la sequence de apoB definie a la 
figure 8. 

Acide nucleique selon Tune des revendications precedentes, 
caracterise en ce que la sequence codant le polypeptide rapporteur 
est choisie dans le groupe constitue des rapporteurs EGFP, p- 
lactamase et luciferase. 

Acide nucleique selon Tune des revendications precedentes, 
caracterise en ce que la sequence codant le peptide signal est 
choisie dans le groupe constitue de peptide suivants : le peptide SS, 
I'hormone de croissance, I'activateur du plasminogene tissulaire, 
l'interleukine-2, la chaine k des immunoglobulines, I'alkaline 
phosphatase, I'haemaglutinine d'lnfluenza. 

Acide nucleique selon I'une des revendications precedentes, 
caracterise en ce que la sequence codant la region 
transmembranaire est choisie dans le groupe constitue du domaine 
transmembranaire du recepteur humain de la transferrine, du 
domaine transmembranaire de la chaTne B du recepteur au facteur 
de croissance derive des plaquettes humain (PDGFR), du domaine 
transmembranaire B7-1 de souris (B7) et du domaine 
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transmembranaire de type II de la sous-unite H1 du recepteur de 
I'asialoglycoproteine (ASGPR). 

Vecteur comprenant un acide nucleique selon I'une des 
revendications 1 a 7, et les sequences perrnettant I'expression de la 
phase ouverte de lecture telle que definie a la revendication 1, dans 
une cellule hote appropriee. 

Cellule hote caracterisee en ce qu'elle comprend I'acide nucleique 
selon Tune des revendications 1 a 7 ou un vecteur selon la 
revendication 8. 

Cellule hote selon la revendication 9, caracterisee en ce qu'elle 
comprend un acide nucleique selon Tune des revendications 1 a 7, 
ou un vecteur selon la revendication 8, et en ce qu'elle comprend 
une sequence perrnettant la synthese d'une enzyme d'edition 
fonctionnelle, notamment Apobec-1 ou Tun de ses analogues, 
susceptibles d'editer I'acide nucleique tel que defini a Tune des 
revendications 1 a 7. 

Cellule hote selon la revendication 10, caracterisee en ce que la 
sequence perrnettant la synthese de ('enzyme d'edition est integree 
de maniere stable dans son genome. 

Methode de criblage d'inhibiteurs de I'activite d'une enzyme 
d'edition, ladite methode comprenant : 

a. la culture d'une cellule selon I'une des revendications 9 a 11, 
dans des conditions appropriees pour la synthese d'une enzyme 
d'edition et d'une proteine chimerique comprenant au moins le 
peptide signal, le polypeptide rapporteur et la region 
transmembranaire tels que definis a I'une des revendications 1 a 
7, en presence ou en absence d'un compose candidat, 
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b. la mesure de la quantite de proteines chimeriques secretees 
dans le milieu de culture, en presence ou en absence du 
compose candidat, 

c. la mesure de la quantite de proteines chimeriques ancrees a la 
membrane cellulaire par la region transmembranaire, 

d. la mise en evidence, en presence du compose candidat, d'une 
variation de la quantite relative de proteines chimeriques 
secretees et/ou ancrees a la membrane cellulaire par rapport a 
la quantite relative de proteines chimeriques secretees et/ou 
ancrees a la membrane cellulaire en absence du compose 
candidat indiquant que ledit compose candidat est un inhibiteur ■ 
de I'activite d'edition de I'enzyme d'edition. 

13. Methode selon la revendication 12, caracterisee en ce que I'enzyme 
d'edition choisie est I'enzyme Apobec-1 ou I'un de ses analogues. 

14. Methode selon la revendication 12 ou 13, caracterisee en ce que la 
proteine chimerique comprend une proteine fluorescente comme 
polypeptide rapporteur et en ce que la mesure de proteines 
chimeriques secretees dans le milieu est effectuee par mesure de la 
fluorescence dans le milieu de culture apres elimination des cellules. 

15. Utilisation d'un acide nucleique selon Tune des revendications 1 a 7 
ou d'un vecteur selon la revendication 8, pour la mise en ceuvre 
d'une methode selon Tune des revendications 12 a 14. 

16. Kit pour la mise en ceuvre d'une methode selon Tune des 
revendications 12 a 14, comprenant soit un acide nucleique selon 
Tune des revendications 1 a 7, soit un vecteur selon la 
revendication 8, soit une cellule selon I'une des revendications 9 a 
1 1 , et le cas echeant, des tampons appropries et/ou des instructions 
pour la mise en oeuvre d'une methode de criblage selon I'une des 
revendications 12 a 14. 
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Fig. 4 
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Peptide signal HA Bglll 
ATG GAG ... GGT GAC TAT CCA TAT GAT GTT CCA GAT TATGCT GGG GCC CAG CCG GCC AGATCT Rapporteur 
ME... GD YPYDVPDYAGAQ PARS 

Sacll ApoB(6507-6B60) Sail Myc PDGFR-TM 

... CCG CGG AAT TCA ... AGT AGT GTC GAC GAA CAA AAA CTC ATC TCA GAA GAG GAT CTG AAT GCT GTG GGC CAG 
... P R N S ... S S V D E Q K L / S E E D L N A V G Q ... 
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Fig. 7 
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gtttgeaage 


aagtctttcc 


tggcctgaat 


tactgcacct 


3060 


caggcgctta 


ctccaacgcc 


agctccacag 


actccgcctc 


ctactatccg 


ctgaccqqgq 


3120 


acaccagatt 


agagctggaa 


ctgaggecta 


caggagagat 


tgagcagtat 


tctgtcagcg 


3180 


caacctatga 


gctccagaga 


gaggacagag 


ccttggtgga 


taccctgaag 


tttgtaactc 


3240 


aagcagaagg 


tgcgaagcag 


actgaggcta 


ccatgacatt 


caaatataat 


eggcagagta 


3300 


tgaccttgtc 


cagtgaagtc 


caaattcegg 


attttgatgt 


tgacctcgga 


acaatcctca 


3360 


gagttaatga 


tgaatctact 


gagggcaaaa 


cgtcttacag 


actcaccctg 


gacattcaga 


3420 


acaagaaaat 


tactgaggtc 


gccctcatgg 


gccacctaag 


ttgtgacaca 


aaggaagaaa 


3480 


gaaaaatcaa 


gggtgttatt 


tccatacccc 


gtttgeaage 


agaagecaga 


agtgagatcc 


3540 


tcgcccactg 


gtcgcctgcc 


aaactgette 


tccaaatgga 


ctcatctgct 


acagcttatg 


3600 


gctccacagt 


ttccaagagg 


gtggcatggc 


attatgatga 


agagaagatt 


gaatttgaat 


3660 


ggaacacagg 


caccaatgta 


gataccaaaa 


aaatgacttc 


caatttccct 


gtggatctct 


3720 


ccgattatcc 


taagagcttg 


catatgtatg 


ctaatagact 


cctggatcac 


agagtccctg 


3780 


aaacagacat 


gactttccgg 


cacgtgggtt 


ccaaattaat 


agttgcaatg 


agctcatggc 


3840 


ttcagaaggc 


atctgggagt 


cttccttata 


cccagacttt 


gcaagaccac 


ctcaatagcc 


3900 


tgaaggagtt 


caacctccag 


aacatgggat 


tgecagaett 


ccacatccca 


gaaaacctct 


3960 


tcttaaaaag 


cgatggccgg 


gtcaaatata 


ccttgaacaa 


gaacagtttg 


aaaattgaga 


4020 


ttcctttgcc 


ttttggtggc 


aaatcctcca 


gagatctaaa 


gatgtt.agag 


actgttagga 


4080 


caccagccct 


ccacttcaag 


tctgtgggat 


tccatctgcc 


atctcgagag 


ttccaagtcc 


4140 


ctacttttac 


cattcccaag 


ttgtatcaac 


tgcaagtgcc 


tctcctgggt 


gttctagacc 


4200 


t ct ccacgaa 


tgtctacagc 


aacttgtaca 


actggtccgc 


ctcctacagt 


ggtggcaaca 


4260 


ccagcacaga 


ccatttcagc 


cttcgggctc 


gttaccacat 


gaaggctgac 


tctgtggttg 


4320 


acctgctttc 


ctacaatgtg 


caaggatctg 


gagaaacaac 


atatgaccac 


aagaatacgt 


4380 


tcacactatc 


atgtgatggg 


tctctacgcc 


acaaatttct 


agattcgaat 


atcaaattca 


4440 


gtcatgtaga 


aaaacttgga 


aacaacccag 


tctcaaaagg 


tttactaata 


ttcgatgeat 


4500 


ctagtt cctg 


arrest pra pan 


O. l_ y Ll/LLjLL L 


rt -a 4- r~ i o 4- 4- +- 

Ualj L LLa L L L 


ggactccaaa 


aagaaacagc 


4560 


atttgtttgt 


caaagaagtc 


aagattgatg 


ggcagttcag 


agtctcttcg ttctatgeta 


4620 


aaggcacata 


tggcctgtct 


tgtcagaggg 


atcctaacac 


tggccggctc 


aatggagagt 


4680 


ccaacctgag 


gtttaactcc 


tcctacctcc 


aaggcaccaa 


ccagataaca 


ggaagatatg 


4740 
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aagatggaac cctctccctc acctccacct ctgatctgca aagtggcatc attaaaaata 4 800 
ctgcttccct aaagtatgag aactacgagc tgactttaaa atctgacacc aatgggaagt 4860 
ataagaactt tgccacttct aacaagatgg atatgacctt ctctaagcaa aatgcactgc 4920 
tgcgttctga atatcaggct gattacgagt cattgaggtt cttcagcctg ctttctggat 4 980 
cactaaattc ccatggtctt gagttaaatg ctgacatctt aggcactgac aaaattaata 5040 
gtggtgctca caaggcgaca ctaaggattg gccaagatgg aatatctacc agtgcaacga 5100 
ccaacttgaa gtgtagtctc ctggtgctgg agaatgagct gaatgcagag cttggcctct 5160 
ctggggcatc tatgaaatta acaacaaatg gccgcttcag ggaacacaat gcaaaattca 5220 
gtctggatgg gaaagccgcc ctcacagagc tatcactggg aagtgcttat caggccatga 5280 
ttctgggtgt cgacagcaaa aacattttca acttcaaggt cagtcaagaa ggacttaagc 5340 
tctcaaatga catgatgggc tcatatgctg aaatgaaatt tgaccacaca aacagtctga 5400 
acattgcagg cttatcactg gacttctctt caaaacttga caacatttac agctctgaca 54 60 

agttttataa gcaaactgtt aatttacagc tacagcccta ttctctggta actactttaa 5520 

acagtgacct gaaatacaat gctctggatc tcaccaacaa tgggaaacta cggctagaac 5580 

ccctgaagct gcatgtggct ggtaacctaa aaggagccta ccaaaataat gaaataaaac 5640 

acatctatgc catctcttct gctgccttat cagcaagcta taaagcagac actgttgcta 5700 

aggttcaggg tgtggagttt agccatcggc tcaacacaga catcgctggg ctggcttcag 5760 

ccattgacat gagcacaaac tataattcag actcactgca tttcagcaat gtcttccgtt 5820 

ctgtaatggc cccgtttacc atgaccatcg atgcacatac aaatggcaat gggaaactcg- 5880 

ctctctgggg agaacatact gggcagctgt atagcaaatt cctgttgaaa gcagaacctc 5940 

tggcatttac tttctctcat gattacaaag gctccacaag tcatcatctc gtgtctagga 6000 

aaagcatcag tgcagctctt gaacacaaag tcagtgccct gcttactcca gctgagcaga 6060 

caggcacctg gaaactcaag acccaattta acaacaatga atacagccag gacttggatg 6120 

cttacaacac taaagataaa attggcgtgg agcttactgg acgaactctg gctgacctaa 6180 

ctctactaga ctccccaatt aaagtgccac ttttactcag tgagcccatc aatatcattg 6240 

atgctttaga gatgagagat gccgttgaga agccccaaga atttacaatt gttgcttttg 6300 

taaagtatga taaaaaccaa gatgttcact ccattaacct cccatttttt gagaccttgc 6360 

aagaatattt tgagaggaat cgacaaacca ttatagttgt agtggaaaac gtacagagaa 6420 

acctgaagca catcaatatt gatcaatttg taagaaaata cagagcagcc ctgggaaaac 6480 

tcccacagca agctaatgat tatctgaatt cattcaattg ggagagacaa gtttcacatg 6540 

ccaaggagaa actgactgct ctcacaaaaa agtatagaat tacagaaaat gatatacaaa 6600 
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ttgcatt aga 


tgatgccaaa 


atcaartf t*a 

u i_ v-r a, i__ L- \— cj. 


atgaaaaact 


atctcaactg 


^ay aua Ud i_a. 


VJ VJ 


tgatacaatt 


tgatcagtat 


att aaagat a 


gttatgattt 


acatgatttg 


aaaafa crci~ a 

qcj. ci cj. i — a v_. i — a. 


6720 


ttgctaatat 


tattgatgaa 


atcattgaaa 


aattaaaaag tcttgatgag 


cact at cat a 


6780 


tccgtgtaaa 


tttagtaaaa 


acaat ccatg 


atctacattt 


gtttattgaa 


aat att gatt 


6840 


ttaacaaaag 


tggaagtagt 


act gcat cct 


ggattcaaaa 


tgtggatact 


aagt accaaa 


6900 


tcagaatcca 


gat acaagaa 


aaact gcagc 


agcttaagag 


acacatacag 


cj. a l_ cj. i— cl y a. ci 


6960 


tccagcacct 


aqctqqaaaq 


ttaaaacaac 


acattgaggc 


tattgatgtt 


acfacrt crct" 1 1 

<-A ^3 w*. y V_ *wJ V_/ 1— L- 


7020 


tagatcaatt 


gggaactaca 


atttcatttg 


aaagaataaa 


tgatgttctt 


gage at gt ca 


708 0 


aacactttgt 


tataaatctt 


attggggatt 


ttgaagtagc 


tgagaaaatc 


aat geett ca 


714 0 


gagccaaagt 


ccatgagtta 


atcqaqaqqt 


atgaagtaga 


ccaacaaatc 


caggtt tt aa 


7200 


t ggataaatt 


agtagagttg 


acccaccaat 


acaagttgaa 


ggagactatt 


cacraacrr , tr3r3 

w i— i. y <_j. cj, cj, cj. 


7260 


gcaatgt cct 


acaacaagtt 


aagataaaag 


attactttga 


gaaattggtt 


crcfsttt^t'hn" 

y y Cj. C I— 1— CJ. 1— I— *J 


7^90 

f JcU 


at gatgctgt 


gaagaagctt 


aatgaattat 


cttttaaaac 


attcattgaa 


gat gtt aaca 


7380 


aattccttga 


catgtt gata 


aagaaattaa 


agtcatttga 


ttaccaccag 


t t t gt a gat g 


74 40 


aaaccaatga 


caaaatccgt 


gagqtqactc 


agagactcaa 


tggtgaaatt 


caggctctgg 


7500 


aactaccaca 


aaaagctgaa 


gcattaaaac 


tgtttttaga 


ggaaaccaag 


crccacacrtt cr 


7560 


cagtgtatct 


ggaaagccta 


caggacacca 


aaataacctt 


aatcatcaat 


taattacaaa 


7620 


aggctttaag 


ttcagcatct 


ttggctcaca 


tgaaggccaa 


attccgagag 


act ctagaag 


7 680 


atacacgaga 


ccqaatqtat 

-> ZJ 


caaatggaca 


ttcagcagga 


acttcaacga 


t a cct gtct c 


11 AO 


tggtaggcca 


ggtttatagc 


acacttgtca 


cctacatttc 


tgattggtgg 


actcttcfctcr 


7800 


ctaagaacct 


tactgacttt 


gcagagcaat 


attctatcca 


agattgggct 


riR r rrrt* Pi "h rr^? 

CJ. Cj. Co. M CJ. 1 — y CI 


7 R 60 

/ o uu 


aagcattggt 


agagcaaggg 


tt cact gtt c 


ctgaaatcaa 


gaccatcctt 


y y yciui — o. i_ y ^ 


7 Q9D 


ctgcctttga 


agtcagtctt 


caggctcttc 


agaaagctac 


cttccagaca 


cct cratttt a 

l_ VJ CJ. < — C, L- L_ CJ. 


7980 


tagtccccct 


aacagatttg 


aggatt ccat 


cagttcagat 

ZJ .3 


aaacttcaaa 


y o. L- L a u. u. d. ct 


O \J *i VJ 


at ataaaaat 


cccatccagg 


t ttt ccacac 


cagaatttac 


catccttaac 




r i nn 

OIUU 


tt ccttcctt 


t acaatt gac 


ttt gt cgaaa 


tgaaagtaaa 


gatcatcaga 




OlDU 


agatgcagaa 


cagtgagctg 


cagtggcccg 


ttccagatat 


atatctcagg 


gatctgaagg 


8220 


tggaggacat 


tcctctagcg 


agaatcaccc 


tgccagactt 


ccgtttacca 


gaaatcgcaa 


8280 


ttccagaatt 


cataatccca 


actctcaacc 


ttaatgattt 


tcaagttcct 


gaccttcaca 


8340 


taccagaatt 


ccagcttccc 


cacatctcac 


acacaattga 


agtacctact 


tttggcaagc 


8400 
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tatacagtat tctgaaaatc caatctcctc ttttcacatt agatgcaaat gctgacatag 84 60 
ggaatggaac cacctcagca aacgaagcag gtatcgcagc ttccatcact gccaaaggag 8520 
agtccaaatt agaagttctc aattttgatt ttcaagcaaa tgcacaactc tcaaacccta 8580 
agattaatcc gctggctctg aaggagtcag tgaagttctc cagcaagtac ctgagaacgg 8 640 
agcatgggag tgaaatgctg ttttttggaa atgctattga gggaaaatca aacacagtgg 8700 
caagtttaca cacagaaaaa aatacactgg agcttagtaa tggagtgatt gtcaagataa 8760 
acaatcagct taccctggat agcaacacta aatacttcca caaattgaac atccccaaac 8820 
tggacttctc tagtcaggct gacctgcgca acgagatcaa gacactgttg aaagctggcc 8880 
acatagcatg gacttcttct ggaaaagggt catggaaatg ggcctgcccc agattctcag 8940 
atgagggaac acatgaatca caaattagtt tcaccataga aggacccctc acttcctttg 9000 
gactgtccaa taagatcaat agcaaacacc taagagtaaa ccaaaacttg gtttatgaat 9060 
ctggctccct caacttttct aaacttgaaa ttcaatcaca agtcgattcc cagcatgtgg 9120 
gccacagtgt tctaactgct aaaggcatgg cactgtttgg agaagggaag gcagagttta 9180 
ctgggaggca tgatgctcat ttaaatggaa aggttattgg aactttgaaa aattctcttt 9240 
tcttttcagc ccagccattt gagatcacgg catccacaaa caatgaaggg aatttgaaag 9300 
ttcgttttcc attaaggtta acagggaaga tagacttcct gaataactat gcactgtttc 9360 
tgagtcccag tgcccagcaa gcaagttggc aagtaagtgc taggttcaat cagtataagt 9420 
acaaccaaaa tttctctgct ggaaacaacg agaacattat ggaggcccat gtaggaataa 9480 
atggagaagc aaatctggat ttcttaaaca ttcctttaac aattcctgaa atgcgtctac' 9540 
cttacacaat aatcacaact cctccactga aagatttctc tctatgggaa aaaacaggct 9600 
tgaaggaatt cttgaaaacg acaaagcaat catttgattt aagtgtaaaa gctcagtata 9660 
agaaaaacaa acacaggcat tccatcacaa atcctttggc tgtgctttgt gagtttatca 9720 
gtcagagcat caaatccttt gacaggcatt ttgaaaaaaa cagaaacaat gcattagatt 9780 
ttgtcaccaa atcctataat gaaacaaaaa ttaagtttga taagtacaaa gctgaaaaat 9840 
ctcacgacga gctccccagg acctttcaaa ttcctggata cactgttcca gttgtcaatg 9900 
ttgaagtgtc tccattcacc atagagatgt cggcattcgg ctatgtgttc ccaaaagcag 9960 
tcagcatgcc tagtttctcc atcctaggtt ctgacgtccg tgtgccttca tacacattaa 10020 
tcctgccatc attagagctg ccagtccttc atgtccctag aaatctcaag ctttctcttc 10080 
cacatttcaa ggaattgtgt accataagcc atatttttat tcctgccatg ggcaatatta 10140 
cctatgattt ctcctttaaa tcaagtgtca tcacactgaa taccaatgct gaacttttta 10200 
accagtcaga tattgttgct catctccttt cttcatcttc atctgtcatt gatgcactgc 10260 
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agtacaaatt 


agagggcacc 


acaagattga 


caagaaaaag 


gggattgaag ttagccacag 


10320 


ctctgtctct 


gagcaacaaa 


tttgtggagg 


gtagtcataa 


cagtactgtg 


agcttaacca 


10380 


cgaaaaatat 


ggaagtgtca 


gtggcaaaaa 


ccacaaaagc 


cgaaattcca 


attttgagaa 


10440 


tgaatttcaa 


gcaagaactt 


aatggaaata 


ccaagtcaaa 


acctactgtc 


tcttcctcca 


10500 


tggaatttaa 


gtatgatttc 


aattcttcaa 


tgctgtactc 


taccgctaaa 


ggagcagttg 


10560 


accacaagct 


tagcttggaa 


agcctcacct 


cttacttttc 


cattgagtca 


tctaccaaag 


10620 


gagatgtcaa 


gggttcggtt 


ctttctcggg 


aatattcagg 


aactattgct 


agtgaggcca 


10680 


acacttactt 


gaattccaag 


agcacacggt 


cttcagtgaa 


gctgcagggc 


acttccaaaa 


10740 


ttgatgatat 


ctggaacctt 


gaagtaaaag 


aaaattttgc 


tggagaagcc 


acactccaac 


10800 


gcatatattc 


cctctgggag 


cacagtacga 


aaaaccactt 


acagctagag 


ggcctctttt 


10860 


tcaccaacgg 


agaacataca 


agcaaagcca 


ccctggaact 


ctctccatgg 


caaatgtcag 


10920 


ctcttgttca 


ggtccatgca 


agtcagccca 


gttccttcca 


tgatttccct 


gaccttggcc 


10980 


aggaagtggc 


cctgaatgct 


aacactaaga 


accagaagat 


cagatggaaa 


aatgaagtcc 


11040 


ggattcattc 


tgggtctttc 


cagagccagg 


tcgagctttc 


caatgaccaa 


gaaaaggcac 


11100 


accttgacat 


tgcaggatcc 


ttagaaggac 


acctaaggtt 


cctcaaaaat 


atcatcctac 


11160 


cagtctatga 


caagagctta 


tgggatttcc 


taaagctgga 


tgtaaccacc 


agcattggta 


11220 


ggagacagca 


tcttcgtgtt 


tcaactgcct 


ttgtgtacac 


caaaaacccc 


aatggctatt 


11280 


cattctccat 


ccctgtaaaa 


gttttggctg 


ataaattcat 


tactcctggg 


ctgaaactaa 


11340 


atgatctaaa 


ttcagttctt 


gtcatgccta 


cgttccatgt 


cccatttaca 


gatcttcagg 


11400 


ttccatcgtg 


caaacttgac 


ttcagagaaa 


tacaaatcta 


taagaagctg 


agaacttcat 


11460 


catttgccct 


caacctacca 


acactccccg 


aggtaaaatt 


ccctgaagtt 


gatgtgttaa 


11520 


caaaatattc 


tcaaccagaa 


gactccttga 


ttcccttttt 


tgagataacc 


gtgcctgaat 


11580 


ctcagttaac 


tgtgtcccag 


ttcacgcttc 


caaaaagtgt 


ttcagatggc 


attgctgctt 


11640 


tggatctaaa 


tgcagtagcc 


aacaagatcg 


cagactttga 


gttgcccacc 


atcatcgtgc 


11700 


ctgagcagac 


cattgagatt 


ccctccatta 


agttctctgt 


acctgctgga 


attgtcattc 


11760 


cttcctttca 


agcactgact 


gcacgctttg 


aggtagactc 


tcccgtgtat 


aatgccactt 


11820 


y ycty ugccag 


uLtigaaaaac 


aaagcagatt 


atgttgaaac 


agtcctggat 


tccacatgca 


11880 


gctcaaccgt 


acagttccta 


gaatatgaac 


taaatgtttt 


gggaacacac 


aaaatcgaag 


11940 


atggtacgtt 


agcctctaag 


actaaaggaa 


cacttgcaca 


ccgtgacttc 


agtgcagaat 


12000 


atgaagaaga 


tggcaaattt 


gaaggacttc 


aggaatggga 


aggaaaagcg 


cacctcaata 


12060 
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tcaaaagccc agcgttcacc gatctccatc tgcgctacca gaaagacaag aaaggcatct 12120 

ccacctcagc agcctcccca gccgtaggca ccgtgggcat ggatatggat gaagatgacg 12180 

acttttctaa atggaacttc tactacagcc ctcagtcctc tccagataaa aaactcacca 12240 

tattcaaaac tgagttgagg gtccgggaat ctgatgagga aactcagatc aaagttaatt 12300 

gggaagaaga ggcagcttct ggcttgctaa cctctctgaa agacaacgtg cccaaggcca 12360 

caggggtcct ttatgattat gtcaacaagt accactggga acacacaggg ctcaccctga 12420 

gagaagtgtc ttcaaagctg agaagaaatc tgcagaacaa tgctgagtgg gtttatcaag 12480 

gggccattag gcaaattgat gatatcgacg tgaggttcca gaaagcagcc agtggcacca 12540 

ctgggaccta ccaagagtgg aaggacaagg cccagaatct gtaccaggaa ctgttgactc 12600 

aggaaggcca agccagtttc cagggactca aggataacgt gtttgatggc ttggtacgag 12660 

ttactcaaaa attccatatg aaagtcaagc atctgattga ctcactcatt gattttctga 12720 

acttccccag attccagttt ccggggaaac ctgggatata cactagggag gaactttgca 12780 

ctatgttcat aagggaggta gggacggtac tgtcccaggt atattcgaaa gtccataatg 12840 

gttcagaaat actgttttcc tatttccaag acctagtgat tacacttcct ttcgagttaa 12900 

ggaaacataa actaatagat gtaatctcga tgtataggga actgttgaaa gatttatcaa 12960 

aagaagccca agaggtattt aaagccattc agtctctcaa gaccacagag gtgctacgta 13020 

atcttcagga ccttttacaa ttcattttcc aactaataga agataacatt aaacagctga 13080 

aagagatgaa atttacttat cttattaatt atatccaaga tgagatcaac acaatcttca 13140 

atgattatat cccatatgtt tttaaattgt tgaaagaaaa cctatgcctt aatcttcata' 13200 

agttcaatga atttattcaa aacgagcttc aggaagcttc tcaagagtta cagcagatcc 13260 

atcaatacat tatggccctt cgtgaagaat attttgatcc aagtatagtt ggctggacag 13320 

tgaaatatta tgaacttgaa gaaaagatag tcagtctgat caagaacctg ttagttgctc 13380 

ttaaggactt ccattctgaa tatattgtca gtgcctctaa ctttacttcc caactctcaa 13440 

gtcaagttga gcaatttctg cacagaaata ttcaggaata tcttagcatc cttaccgatc 13500 

cagatggaaa agggaaagag aagattgcag agctttctgc cactgctcag gaaataatta 13560 

aaagccaggc cattgcgacg aagaaaataa tttctgatta ccaccagcag tttagatata 13620 

aactgcaaga tttttcagac caactctctg attactatga aaaatttatt gctgaatcca 13680 

aaagattgat tgacctgtcc attcaaaact accacacatt tctgatatac atcacggagt 13740 

tactgaaaaa gctgcaatca accacagtca tgaaccccta catgaagctt gctccaggag 13800 

aacttactat catcctctaa ttttttaaaa gaaatcttca tttattcttc ttttccaatt 13860 

gaactttcac atagcacaga aaaaattcaa actgcctata ttgataaaac catacagtga 13920 
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gccagccttg cagtaggcag tagactataa gcagaagcac atatgaactg gacctgcacc 13980 

aaagctggca ccagggctcg gaaggtctct gaactcagaa ggatggcatt ttttgcaagt 14040 

taaagaaaat caggatctga gttattttgc taaacttggg ggaggaggaa caaataaatg 14100 

gagtctttat tgtgtatcat a 14121 

<210> 2 
<211> 26 
<212> DNA 

<213> artificial: primer 
<400> 2 

gagatctgtg agcaagggcg aggagc 26 

<210> 3 
<211> 27 
<212> DNA 

<213> artificial: primer 
<400> 3 

gccgcggctt gtacagctcg tccatgc 27 

<210> 4 
<211> 28 
<212> DNA 

<213> artificial: primer 
<400> 4 

gagatctgtc accgacgcca aaaacata ■ 28 

<210> 5 
<211> 26 
<212> DNA 

<213> artificial: primer 
<400> 5 

gccgcggcac ggcgatcttt ccgccc 26 



<210> 6 
<211> 27 
<212> DNA 

<213> artificial: primer 
<400> 6 

gagatctcac ccagaaacgc tggtgaa 



<210> 7 

<211> 26 

<212> DNA 

<213> artificial: primer 

<400> 7 
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gccgcggcca atgcttaatc agtgag 

<210> 8 
<211> 31 
<212> DNA 

<213> artificial: primer 
<400> 8 

gccgcggaat tcattcaatt gggagagaca a 



<210> 9 
<211> 31 
<212> DNA 

<213> artificial: primer 
<400> 9 

ggtcgacact acttccactt ttgttaaaat c 



<210> 10 
<211> 22 
<212> DNA 

<213> artificial: primer 
<400> 10 

gcatctgact gggagagaca ag 



<210> 11 
<211> 23 
<212> DNA 

<213> artificial: primer 
<400> 11 

ggatatgata ctgttcgtca age 



<210> 12 
<211> 21 
<212> DNA 

<213> artificial: primer 
<400> 12 

aagaaaatac agagcagccc t 21 

<210> 13 
<211> 21 
<212> DNA 

<213> artificial: primer 
<400> 13 

gtgctggatg tctatattct g 21 



<210> 14 

<211> 19 

<212> DNA 

<213> artificial: primer 
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<400> 14 

aaagggcaag gagtgtggc 19 

<210> 15 
<211> 18 
<212> DNA 

<213> artificial: primer 
<400> 15 

aagaccccaa cgagaagc j.8 

<210> 16 
<211> 18 
<212> DNA 

<213> artificial: primer 
<400> 16 

ggcaactatg gatgaacg 18 

<210> 17 
<211> 18 
<212> DNA 

<213> artificial: primer 
<400> 17 

ccaagaaggg cggaaaga -]_g 

<210> 18 
<211> 19 
<212> DNA 

<213> artificial: primer 
<400> 18 

aagtagctgg tgccaagga lg 

<210> 19 
<211> 21 
<212> DNA 

<213> artificial: primer 
<400> 19 

cacggatatg atagtgctca t 21 
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